Чтение данных

В вашем варианте нужно использовать датасет food.

food <- read_csv("data/food.csv")
## Rows: 7083 Columns: 38
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr  (2): Category, Description
## dbl (36): Nutrient Data Bank Number, Data.Alpha Carotene, Data.Beta Carotene...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Выведите общее описание данных

summary (food)
##    Category         Description        Nutrient Data Bank Number
##  Length:7083        Length:7083        Min.   :11000000         
##  Class :character   Class :character   1st Qu.:27150770         
##  Mode  :character   Mode  :character   Median :53260200         
##                                        Mean   :48849646         
##                                        3rd Qu.:67203450         
##                                        Max.   :99998210         
##  Data.Alpha Carotene Data.Beta Carotene Data.Beta Cryptoxanthin
##  Min.   :   0.00     Min.   :    0.0    Min.   :   0.000       
##  1st Qu.:   0.00     1st Qu.:    0.0    1st Qu.:   0.000       
##  Median :   0.00     Median :    8.0    Median :   0.000       
##  Mean   :  43.76     Mean   :  255.4    Mean   :   4.862       
##  3rd Qu.:   1.00     3rd Qu.:   73.0    3rd Qu.:   1.000       
##  Max.   :4655.00     Max.   :14134.0    Max.   :1922.000       
##  Data.Carbohydrate Data.Cholesterol   Data.Choline      Data.Fiber    
##  Min.   :  0.00    Min.   :   0.00   Min.   :  0.00   Min.   : 0.000  
##  1st Qu.:  5.65    1st Qu.:   0.00   1st Qu.: 10.00   1st Qu.: 0.100  
##  Median : 13.30    Median :   8.00   Median : 19.60   Median : 1.000  
##  Mean   : 20.83    Mean   :  34.46   Mean   : 34.44   Mean   : 1.704  
##  3rd Qu.: 26.20    3rd Qu.:  46.00   3rd Qu.: 44.20   3rd Qu.: 2.100  
##  Max.   :100.00    Max.   :3074.00   Max.   :820.20   Max.   :46.200  
##  Data.Lutein and Zeaxanthin Data.Lycopene      Data.Niacin     
##  Min.   :    0.0            Min.   :    0.0   Min.   :  0.000  
##  1st Qu.:    0.0            1st Qu.:    0.0   1st Qu.:  0.535  
##  Median :   18.0            Median :    0.0   Median :  1.487  
##  Mean   :  213.4            Mean   :  263.6   Mean   :  2.647  
##  3rd Qu.:   81.0            3rd Qu.:    0.0   3rd Qu.:  3.400  
##  Max.   :15643.0            Max.   :45902.0   Max.   :127.500  
##   Data.Protein     Data.Retinol     Data.Riboflavin   Data.Selenium    
##  Min.   : 0.000   Min.   :   0.00   Min.   : 0.0000   Min.   :   0.00  
##  1st Qu.: 2.220   1st Qu.:   0.00   1st Qu.: 0.0600   1st Qu.:   1.70  
##  Median : 6.190   Median :   8.00   Median : 0.1240   Median :   8.10  
##  Mean   : 8.599   Mean   :  49.83   Mean   : 0.1888   Mean   :  13.09  
##  3rd Qu.:12.130   3rd Qu.:  43.00   3rd Qu.: 0.2200   3rd Qu.:  20.00  
##  Max.   :78.130   Max.   :9349.00   Max.   :17.5000   Max.   :1917.00  
##  Data.Sugar Total  Data.Thiamin       Data.Water    Data.Fat.Monosaturated Fat
##  Min.   : 0.000   Min.   : 0.0000   Min.   : 0.00   Min.   : 0.000            
##  1st Qu.: 0.780   1st Qu.: 0.0400   1st Qu.:45.90   1st Qu.: 0.513            
##  Median : 2.390   Median : 0.0870   Median :66.59   Median : 1.869            
##  Mean   : 7.337   Mean   : 0.1714   Mean   :59.80   Mean   : 3.218            
##  3rd Qu.: 7.380   3rd Qu.: 0.1890   3rd Qu.:80.61   3rd Qu.: 4.433            
##  Max.   :99.800   Max.   :23.3750   Max.   :99.98   Max.   :75.221            
##  Data.Fat.Polysaturated Fat Data.Fat.Saturated Fat Data.Fat.Total Lipid
##  Min.   : 0.000             Min.   : 0.000         Min.   :  0.000     
##  1st Qu.: 0.338             1st Qu.: 0.503         1st Qu.:  2.060     
##  Median : 1.036             Median : 1.444         Median :  5.480     
##  Mean   : 2.174             Mean   : 2.795         Mean   :  8.958     
##  3rd Qu.: 2.625             3rd Qu.: 3.668         3rd Qu.: 12.650     
##  Max.   :67.849             Max.   :82.500         Max.   :100.000     
##  Data.Major Minerals.Calcium Data.Major Minerals.Copper
##  Min.   :   0.00             Min.   : 0.0000           
##  1st Qu.:  14.00             1st Qu.: 0.0500           
##  Median :  37.00             Median : 0.0790           
##  Mean   :  73.47             Mean   : 0.1416           
##  3rd Qu.:  92.00             3rd Qu.: 0.1280           
##  Max.   :1375.00             Max.   :14.4660           
##  Data.Major Minerals.Iron Data.Major Minerals.Magnesium
##  Min.   : 0.000           Min.   :  0.00               
##  1st Qu.: 0.460           1st Qu.: 12.00               
##  Median : 1.040           Median : 20.00               
##  Mean   : 1.752           Mean   : 27.79               
##  3rd Qu.: 1.840           3rd Qu.: 29.00               
##  Max.   :64.100           Max.   :611.00               
##  Data.Major Minerals.Phosphorus Data.Major Minerals.Potassium
##  Min.   :   0.0                 Min.   :   0.0               
##  1st Qu.:  48.0                 1st Qu.: 111.0               
##  Median : 102.0                 Median : 183.0               
##  Mean   : 133.1                 Mean   : 217.1               
##  3rd Qu.: 189.0                 3rd Qu.: 270.5               
##  Max.   :1429.0                 Max.   :6040.0               
##  Data.Major Minerals.Sodium Data.Major Minerals.Zinc
##  Min.   :   0.0             Min.   : 0.000          
##  1st Qu.: 124.0             1st Qu.: 0.360          
##  Median : 313.0             Median : 0.680          
##  Mean   : 340.5             Mean   : 1.281          
##  3rd Qu.: 454.0             3rd Qu.: 1.360          
##  Max.   :7851.0             Max.   :98.860          
##  Data.Vitamins.Vitamin A - RAE Data.Vitamins.Vitamin B12
##  Min.   :   0.00               Min.   : 0.0000          
##  1st Qu.:   2.00               1st Qu.: 0.0000          
##  Median :  20.00               Median : 0.1800          
##  Mean   :  73.14               Mean   : 0.7052          
##  3rd Qu.:  61.00               3rd Qu.: 0.5500          
##  Max.   :9363.00               Max.   :82.4400          
##  Data.Vitamins.Vitamin B6 Data.Vitamins.Vitamin C Data.Vitamins.Vitamin E
##  Min.   : 0.0000          Min.   :  0.000         Min.   :  0.000        
##  1st Qu.: 0.0520          1st Qu.:  0.000         1st Qu.:  0.230        
##  Median : 0.1100          Median :  0.700         Median :  0.550        
##  Mean   : 0.1975          Mean   :  5.696         Mean   :  1.087        
##  3rd Qu.: 0.2030          3rd Qu.:  5.300         3rd Qu.:  1.110        
##  Max.   :12.0000          Max.   :560.000         Max.   :149.400        
##  Data.Vitamins.Vitamin K
##  Min.   :   0.00        
##  1st Qu.:   0.80        
##  Median :   3.80        
##  Mean   :  14.21        
##  3rd Qu.:   9.30        
##  Max.   :1640.00

Очистка данных

  1. Уберите переменные, в которых пропущенных значений больше 20% или уберите субъектов со слишком большим количеством пропущенных значений. Или совместите оба варианта. Напишите обоснование, почему вы выбрали тот или иной вариант:

Обоснование: нет пропущенных значений.

  1. Переименуйте переменные в человекочитаемый вид (что делать с пробелами в названиях?);

  2. В соответствии с описанием данных приведите переменные к нужному типу (numeric или factor);

  3. Отсортируйте данные по возрасту (углеводам) по убыванию;

  4. Сохраните в файл outliers.csv субъектов, которые являются выбросами (например, по правилу трёх сигм) — это необязательное задание со звёздочкой;

  5. Отфильтруйте датасет так, чтобы остались только Rice и Cookie (переменная Category и есть группирующая);

  6. Присвойте получившийся датасет переменной “cleaned_data”.

food %>% summarise_all(~ sum(is.na(.)))  #проверка наличия пропущенных значений
names(food) <- names(food) %>% str_replace_all("\\.", "_") %>% str_replace_all(" ", "_") %>% str_remove_all("Data_") %>%  str_remove_all ("-_|Major_|Fat_|Vitamins_")

outliers_ci <- food  %>%  mutate(Outlier = (Carbohydrate < quantile(Carbohydrate, 0.25) - IQR(Carbohydrate)*1.5 |
           Carbohydrate > quantile(Carbohydrate, 0.75) + IQR(Carbohydrate)*1.5)) %>% filter(Outlier)  # outliers СI

# Сохраним значения outliers в отдельный .csv
outliers <- food %>%  mutate (Outlier1 = Carbohydrate > mean(Carbohydrate) + 3*sd(Carbohydrate) |
           Carbohydrate < mean(Carbohydrate) - 3*sd(Carbohydrate))  %>% filter(Outlier1==  T) %>% select (!Outlier1)   # по правилу 3 сигм

write.csv(outliers, "outliers.csv", row.names = FALSE)

cleaned_data <- food %>% mutate (Category= as.factor(Category), `Nutrient_Bank_Number`= as.factor(`Nutrient_Bank_Number`)) %>% arrange(desc(Carbohydrate)) %>% filter (Category %in% c("Rice", "Cookie"))
cleaned_data$Category <- droplevels(cleaned_data$Category) # удалим убранные уровни фактора 

Сколько осталось переменных?

length (cleaned_data)
## [1] 38
paste0 ("new dataframe contains ",  length (cleaned_data) , " variables")
## [1] "new dataframe contains 38 variables"

Сколько осталось случаев?

nrow (cleaned_data)
## [1] 243
paste0 ("new dataframe contains ",  nrow(cleaned_data) , " rows")
## [1] "new dataframe contains 243 rows"

Есть ли в данных идентичные строки?

  dupl<-duplicated(cleaned_data)
  ifelse (length (dupl [dupl== T]) >0 , "there are identical variables", "no indentical variables")
## [1] "no indentical variables"
# либо вывести идентичные строки 
  cleaned_data|>
  group_by_all() |>
  filter(n() > 1) |>
  ungroup()

Сколько всего переменных с пропущенными значениями в данных и сколько пропущенных точек в каждой такой переменной?

# с пропущенными значениями

var_with_NA<-cleaned_data %>% select (where(~sum(is.na(.)) > 0)) %>%  length()
paste0 ("dataframe cleaned_data contains ",  var_with_NA, " variables with missing values")
## [1] "dataframe cleaned_data contains 0 variables with missing values"
#  сколько пропущенных значений в каждой переменной

food %>% summarise_all(~ sum(is.na(.)))  %>% pivot_longer(cols = everything()) 

Описательные статистики

Количественные переменные

  1. Рассчитайте для всех количественных переменных для каждой группы (Category):

1.1) Количество значений;

1.2) Количество пропущенных значений;

1.3) Среднее;

1.4) Медиану;

1.5) Стандартное отклонение;

1.6) 25% квантиль и 75% квантиль;

1.7) Интерквартильный размах;

1.8) Минимум;

1.9) Максимум;

1.10) 95% ДИ для среднего - задание со звёздочкой.

statistics <- list(
      `Количество значений` = ~length(.x) %>%as.character(),
      `Количество пропущенных значений` = ~sum(is.na(.x)) %>%as.character(),
      `Среднее значение` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", mean(.x, na.rm = TRUE) %>% round(2) %>% as.character()),
      `Медиана` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", median (.x, na.rm = TRUE) %>% round(2) %>% as.character()),
      `Станд. отклон.` = ~ifelse(sum(!is.na(.x)) < 3, "Н/П*", sd(.x, na.rm = TRUE) %>% round(2) %>% as.character()),
      `Q1 - Q3` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", paste0(quantile(.x, 0.25, na.rm = TRUE) %>% round(2), " - ", quantile(.x, 0.75, na.rm = TRUE) %>% round(2))),
      `IQR` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", round(quantile(.x, 0.75, na.rm = TRUE) -  quantile(.x, 0.25, na.rm = TRUE), 2))%>% as.character(),
      `мин. - макс.` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", paste0(min(.x, na.rm = TRUE) %>% round(2), " - ", max(.x, na.rm = TRUE) %>% round(2))),
      `CI` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", paste0( (mean(.x, na.rm = TRUE) - (1.96 * sd(.x, na.rm = TRUE)/sqrt (length(.x)))) %>% round(2) , " - ", (mean(.x, na.rm = TRUE) + (1.96 * sd(.x, na.rm = TRUE)/sqrt(length(.x)))) %>% round(2)))
      )

cleaned_data %>%
  select (Category, where ( is.numeric)) %>%
  group_by (Category) %>%
  summarise (across(where(is.numeric), statistics)) %>%
  pivot_longer (!Category) %>%
  separate (name, into = c ("Переменная", "Статистика"), sep= "_(?!.*_)") %>%
  rename (`Значение` = value, `Категория` = Category) %>%
  flextable()

Категория

Переменная

Статистика

Значение

Cookie

Alpha_Carotene

Количество значений

100

Cookie

Alpha_Carotene

Количество пропущенных значений

0

Cookie

Alpha_Carotene

Среднее значение

8.25

Cookie

Alpha_Carotene

Медиана

0

Cookie

Alpha_Carotene

Станд. отклон.

80.99

Cookie

Alpha_Carotene

Q1 - Q3

0 - 0

Cookie

Alpha_Carotene

IQR

0

Cookie

Alpha_Carotene

мин. - макс.

0 - 810

Cookie

Alpha_Carotene

CI

-7.62 - 24.12

Cookie

Beta_Carotene

Количество значений

100

Cookie

Beta_Carotene

Количество пропущенных значений

0

Cookie

Beta_Carotene

Среднее значение

17.43

Cookie

Beta_Carotene

Медиана

0

Cookie

Beta_Carotene

Станд. отклон.

102.62

Cookie

Beta_Carotene

Q1 - Q3

0 - 1

Cookie

Beta_Carotene

IQR

1

Cookie

Beta_Carotene

мин. - макс.

0 - 1002

Cookie

Beta_Carotene

CI

-2.68 - 37.54

Cookie

Beta_Cryptoxanthin

Количество значений

100

Cookie

Beta_Cryptoxanthin

Количество пропущенных значений

0

Cookie

Beta_Cryptoxanthin

Среднее значение

0.38

Cookie

Beta_Cryptoxanthin

Медиана

0

Cookie

Beta_Cryptoxanthin

Станд. отклон.

1.98

Cookie

Beta_Cryptoxanthin

Q1 - Q3

0 - 0

Cookie

Beta_Cryptoxanthin

IQR

0

Cookie

Beta_Cryptoxanthin

мин. - макс.

0 - 18

Cookie

Beta_Cryptoxanthin

CI

-0.01 - 0.77

Cookie

Carbohydrate

Количество значений

100

Cookie

Carbohydrate

Количество пропущенных значений

0

Cookie

Carbohydrate

Среднее значение

68.09

Cookie

Carbohydrate

Медиана

67.78

Cookie

Carbohydrate

Станд. отклон.

6.95

Cookie

Carbohydrate

Q1 - Q3

63.87 - 72.22

Cookie

Carbohydrate

IQR

8.35

Cookie

Carbohydrate

мин. - макс.

50.52 - 84

Cookie

Carbohydrate

CI

66.72 - 69.45

Cookie

Cholesterol

Количество значений

100

Cookie

Cholesterol

Количество пропущенных значений

0

Cookie

Cholesterol

Среднее значение

8.68

Cookie

Cholesterol

Медиана

0

Cookie

Cholesterol

Станд. отклон.

26.92

Cookie

Cholesterol

Q1 - Q3

0 - 2

Cookie

Cholesterol

IQR

2

Cookie

Cholesterol

мин. - макс.

0 - 221

Cookie

Cholesterol

CI

3.4 - 13.96

Cookie

Choline

Количество значений

100

Cookie

Choline

Количество пропущенных значений

0

Cookie

Choline

Среднее значение

13.28

Cookie

Choline

Медиана

11.05

Cookie

Choline

Станд. отклон.

12.36

Cookie

Choline

Q1 - Q3

6.7 - 14.6

Cookie

Choline

IQR

7.9

Cookie

Choline

мин. - макс.

0 - 92

Cookie

Choline

CI

10.85 - 15.7

Cookie

Fiber

Количество значений

100

Cookie

Fiber

Количество пропущенных значений

0

Cookie

Fiber

Среднее значение

2.67

Cookie

Fiber

Медиана

2.1

Cookie

Fiber

Станд. отклон.

2.5

Cookie

Fiber

Q1 - Q3

1.48 - 3

Cookie

Fiber

IQR

1.52

Cookie

Fiber

мин. - макс.

0 - 16.1

Cookie

Fiber

CI

2.18 - 3.16

Cookie

Lutein_and_Zeaxanthin

Количество значений

100

Cookie

Lutein_and_Zeaxanthin

Количество пропущенных значений

0

Cookie

Lutein_and_Zeaxanthin

Среднее значение

23.15

Cookie

Lutein_and_Zeaxanthin

Медиана

8

Cookie

Lutein_and_Zeaxanthin

Станд. отклон.

38.93

Cookie

Lutein_and_Zeaxanthin

Q1 - Q3

3 - 29

Cookie

Lutein_and_Zeaxanthin

IQR

26

Cookie

Lutein_and_Zeaxanthin

мин. - макс.

0 - 266

Cookie

Lutein_and_Zeaxanthin

CI

15.52 - 30.78

Cookie

Lycopene

Количество значений

100

Cookie

Lycopene

Количество пропущенных значений

0

Cookie

Lycopene

Среднее значение

0.02

Cookie

Lycopene

Медиана

0

Cookie

Lycopene

Станд. отклон.

0.2

Cookie

Lycopene

Q1 - Q3

0 - 0

Cookie

Lycopene

IQR

0

Cookie

Lycopene

мин. - макс.

0 - 2

Cookie

Lycopene

CI

-0.02 - 0.06

Cookie

Niacin

Количество значений

100

Cookie

Niacin

Количество пропущенных значений

0

Cookie

Niacin

Среднее значение

2.72

Cookie

Niacin

Медиана

2.23

Cookie

Niacin

Станд. отклон.

2.07

Cookie

Niacin

Q1 - Q3

1.75 - 3.14

Cookie

Niacin

IQR

1.39

Cookie

Niacin

мин. - макс.

0.05 - 15.97

Cookie

Niacin

CI

2.31 - 3.12

Cookie

Protein

Количество значений

100

Cookie

Protein

Количество пропущенных значений

0

Cookie

Protein

Среднее значение

5.34

Cookie

Protein

Медиана

5

Cookie

Protein

Станд. отклон.

2.16

Cookie

Protein

Q1 - Q3

3.8 - 6.2

Cookie

Protein

IQR

2.4

Cookie

Protein

мин. - макс.

2.19 - 12.5

Cookie

Protein

CI

4.92 - 5.76

Cookie

Retinol

Количество значений

100

Cookie

Retinol

Количество пропущенных значений

0

Cookie

Retinol

Среднее значение

20.13

Cookie

Retinol

Медиана

0.5

Cookie

Retinol

Станд. отклон.

57.16

Cookie

Retinol

Q1 - Q3

0 - 7

Cookie

Retinol

IQR

7

Cookie

Retinol

мин. - макс.

0 - 270

Cookie

Retinol

CI

8.93 - 31.33

Cookie

Riboflavin

Количество значений

100

Cookie

Riboflavin

Количество пропущенных значений

0

Cookie

Riboflavin

Среднее значение

0.28

Cookie

Riboflavin

Медиана

0.23

Cookie

Riboflavin

Станд. отклон.

0.33

Cookie

Riboflavin

Q1 - Q3

0.19 - 0.29

Cookie

Riboflavin

IQR

0.11

Cookie

Riboflavin

мин. - макс.

0.04 - 3.23

Cookie

Riboflavin

CI

0.21 - 0.34

Cookie

Selenium

Количество значений

100

Cookie

Selenium

Количество пропущенных значений

0

Cookie

Selenium

Среднее значение

8.13

Cookie

Selenium

Медиана

6.3

Cookie

Selenium

Станд. отклон.

4.98

Cookie

Selenium

Q1 - Q3

4.75 - 10

Cookie

Selenium

IQR

5.25

Cookie

Selenium

мин. - макс.

0 - 24.7

Cookie

Selenium

CI

7.16 - 9.11

Cookie

Sugar_Total

Количество значений

100

Cookie

Sugar_Total

Количество пропущенных значений

0

Cookie

Sugar_Total

Среднее значение

32.71

Cookie

Sugar_Total

Медиана

32.9

Cookie

Sugar_Total

Станд. отклон.

12.45

Cookie

Sugar_Total

Q1 - Q3

24.66 - 41.11

Cookie

Sugar_Total

IQR

16.45

Cookie

Sugar_Total

мин. - макс.

0 - 80.35

Cookie

Sugar_Total

CI

30.27 - 35.15

Cookie

Thiamin

Количество значений

100

Cookie

Thiamin

Количество пропущенных значений

0

Cookie

Thiamin

Среднее значение

0.27

Cookie

Thiamin

Медиана

0.26

Cookie

Thiamin

Станд. отклон.

0.18

Cookie

Thiamin

Q1 - Q3

0.18 - 0.3

Cookie

Thiamin

IQR

0.12

Cookie

Thiamin

мин. - макс.

0 - 1.46

Cookie

Thiamin

CI

0.24 - 0.3

Cookie

Water

Количество значений

100

Cookie

Water

Количество пропущенных значений

0

Cookie

Water

Среднее значение

7.89

Cookie

Water

Медиана

5.76

Cookie

Water

Станд. отклон.

5.79

Cookie

Water

Q1 - Q3

3.6 - 11.5

Cookie

Water

IQR

7.9

Cookie

Water

мин. - макс.

0.7 - 24.83

Cookie

Water

CI

6.75 - 9.02

Cookie

Monosaturated_Fat

Количество значений

100

Cookie

Monosaturated_Fat

Количество пропущенных значений

0

Cookie

Monosaturated_Fat

Среднее значение

6.08

Cookie

Monosaturated_Fat

Медиана

6.07

Cookie

Monosaturated_Fat

Станд. отклон.

3.23

Cookie

Monosaturated_Fat

Q1 - Q3

3.29 - 8.5

Cookie

Monosaturated_Fat

IQR

5.21

Cookie

Monosaturated_Fat

мин. - макс.

0 - 16.08

Cookie

Monosaturated_Fat

CI

5.44 - 6.71

Cookie

Polysaturated_Fat

Количество значений

100

Cookie

Polysaturated_Fat

Количество пропущенных значений

0

Cookie

Polysaturated_Fat

Среднее значение

4.12

Cookie

Polysaturated_Fat

Медиана

3.26

Cookie

Polysaturated_Fat

Станд. отклон.

2.62

Cookie

Polysaturated_Fat

Q1 - Q3

2.26 - 5.75

Cookie

Polysaturated_Fat

IQR

3.49

Cookie

Polysaturated_Fat

мин. - макс.

0 - 11.49

Cookie

Polysaturated_Fat

CI

3.61 - 4.63

Cookie

Saturated_Fat

Количество значений

100

Cookie

Saturated_Fat

Количество пропущенных значений

0

Cookie

Saturated_Fat

Среднее значение

6.04

Cookie

Saturated_Fat

Медиана

4.61

Cookie

Saturated_Fat

Станд. отклон.

4.58

Cookie

Saturated_Fat

Q1 - Q3

3.05 - 8.09

Cookie

Saturated_Fat

IQR

5.04

Cookie

Saturated_Fat

мин. - макс.

0 - 20.1

Cookie

Saturated_Fat

CI

5.14 - 6.94

Cookie

Total_Lipid

Количество значений

100

Cookie

Total_Lipid

Количество пропущенных значений

0

Cookie

Total_Lipid

Среднее значение

17.33

Cookie

Total_Lipid

Медиана

17.95

Cookie

Total_Lipid

Станд. отклон.

7.12

Cookie

Total_Lipid

Q1 - Q3

13.1 - 22.55

Cookie

Total_Lipid

IQR

9.45

Cookie

Total_Lipid

мин. - макс.

0.34 - 35.3

Cookie

Total_Lipid

CI

15.93 - 18.72

Cookie

Minerals_Calcium

Количество значений

100

Cookie

Minerals_Calcium

Количество пропущенных значений

0

Cookie

Minerals_Calcium

Среднее значение

33.18

Cookie

Minerals_Calcium

Медиана

28

Cookie

Minerals_Calcium

Станд. отклон.

35.29

Cookie

Minerals_Calcium

Q1 - Q3

12 - 46

Cookie

Minerals_Calcium

IQR

34

Cookie

Minerals_Calcium

мин. - макс.

0 - 263

Cookie

Minerals_Calcium

CI

26.26 - 40.1

Cookie

Minerals_Copper

Количество значений

100

Cookie

Minerals_Copper

Количество пропущенных значений

0

Cookie

Minerals_Copper

Среднее значение

0.2

Cookie

Minerals_Copper

Медиана

0.18

Cookie

Minerals_Copper

Станд. отклон.

0.11

Cookie

Minerals_Copper

Q1 - Q3

0.11 - 0.27

Cookie

Minerals_Copper

IQR

0.16

Cookie

Minerals_Copper

мин. - макс.

0.02 - 0.58

Cookie

Minerals_Copper

CI

0.18 - 0.23

Cookie

Minerals_Iron

Количество значений

100

Cookie

Minerals_Iron

Количество пропущенных значений

0

Cookie

Minerals_Iron

Среднее значение

3.03

Cookie

Minerals_Iron

Медиана

2.58

Cookie

Minerals_Iron

Станд. отклон.

1.91

Cookie

Minerals_Iron

Q1 - Q3

2.2 - 3.21

Cookie

Minerals_Iron

IQR

1.01

Cookie

Minerals_Iron

мин. - макс.

0 - 12.14

Cookie

Minerals_Iron

CI

2.66 - 3.41

Cookie

Minerals_Magnesium

Количество значений

100

Cookie

Minerals_Magnesium

Количество пропущенных значений

0

Cookie

Minerals_Magnesium

Среднее значение

30.81

Cookie

Minerals_Magnesium

Медиана

31

Cookie

Minerals_Magnesium

Станд. отклон.

16.97

Cookie

Minerals_Magnesium

Q1 - Q3

15.5 - 40.25

Cookie

Minerals_Magnesium

IQR

24.75

Cookie

Minerals_Magnesium

мин. - макс.

6 - 101

Cookie

Minerals_Magnesium

CI

27.48 - 34.14

Cookie

Minerals_Phosphorus

Количество значений

100

Cookie

Minerals_Phosphorus

Количество пропущенных значений

0

Cookie

Minerals_Phosphorus

Среднее значение

98.48

Cookie

Minerals_Phosphorus

Медиана

94

Cookie

Minerals_Phosphorus

Станд. отклон.

47.59

Cookie

Minerals_Phosphorus

Q1 - Q3

66 - 122.25

Cookie

Minerals_Phosphorus

IQR

56.25

Cookie

Minerals_Phosphorus

мин. - макс.

5 - 277

Cookie

Minerals_Phosphorus

CI

89.15 - 107.81

Cookie

Minerals_Potassium

Количество значений

100

Cookie

Minerals_Potassium

Количество пропущенных значений

0

Cookie

Minerals_Potassium

Среднее значение

170.69

Cookie

Minerals_Potassium

Медиана

149

Cookie

Minerals_Potassium

Станд. отклон.

90.42

Cookie

Minerals_Potassium

Q1 - Q3

110 - 207

Cookie

Minerals_Potassium

IQR

97

Cookie

Minerals_Potassium

мин. - макс.

39 - 504

Cookie

Minerals_Potassium

CI

152.97 - 188.41

Cookie

Minerals_Sodium

Количество значений

100

Cookie

Minerals_Sodium

Количество пропущенных значений

0

Cookie

Minerals_Sodium

Среднее значение

336.08

Cookie

Minerals_Sodium

Медиана

350

Cookie

Minerals_Sodium

Станд. отклон.

123.71

Cookie

Minerals_Sodium

Q1 - Q3

256.75 - 403.75

Cookie

Minerals_Sodium

IQR

147

Cookie

Minerals_Sodium

мин. - макс.

9 - 580

Cookie

Minerals_Sodium

CI

311.83 - 360.33

Cookie

Minerals_Zinc

Количество значений

100

Cookie

Minerals_Zinc

Количество пропущенных значений

0

Cookie

Minerals_Zinc

Среднее значение

0.64

Cookie

Minerals_Zinc

Медиана

0.63

Cookie

Minerals_Zinc

Станд. отклон.

0.29

Cookie

Minerals_Zinc

Q1 - Q3

0.45 - 0.75

Cookie

Minerals_Zinc

IQR

0.3

Cookie

Minerals_Zinc

мин. - макс.

0.03 - 1.6

Cookie

Minerals_Zinc

CI

0.58 - 0.69

Cookie

Vitamin_A_RAE

Количество значений

100

Cookie

Vitamin_A_RAE

Количество пропущенных значений

0

Cookie

Vitamin_A_RAE

Среднее значение

21.96

Cookie

Vitamin_A_RAE

Медиана

1

Cookie

Vitamin_A_RAE

Станд. отклон.

58.92

Cookie

Vitamin_A_RAE

Q1 - Q3

0 - 8

Cookie

Vitamin_A_RAE

IQR

8

Cookie

Vitamin_A_RAE

мин. - макс.

0 - 270

Cookie

Vitamin_A_RAE

CI

10.41 - 33.51

Cookie

Vitamin_B12

Количество значений

100

Cookie

Vitamin_B12

Количество пропущенных значений

0

Cookie

Vitamin_B12

Среднее значение

0.06

Cookie

Vitamin_B12

Медиана

0.01

Cookie

Vitamin_B12

Станд. отклон.

0.11

Cookie

Vitamin_B12

Q1 - Q3

0 - 0.07

Cookie

Vitamin_B12

IQR

0.07

Cookie

Vitamin_B12

мин. - макс.

0 - 0.75

Cookie

Vitamin_B12

CI

0.04 - 0.08

Cookie

Vitamin_B6

Количество значений

100

Cookie

Vitamin_B6

Количество пропущенных значений

0

Cookie

Vitamin_B6

Среднее значение

0.16

Cookie

Vitamin_B6

Медиана

0.06

Cookie

Vitamin_B6

Станд. отклон.

0.61

Cookie

Vitamin_B6

Q1 - Q3

0.03 - 0.09

Cookie

Vitamin_B6

IQR

0.07

Cookie

Vitamin_B6

мин. - макс.

0 - 5.9

Cookie

Vitamin_B6

CI

0.04 - 0.28

Cookie

Vitamin_C

Количество значений

100

Cookie

Vitamin_C

Количество пропущенных значений

0

Cookie

Vitamin_C

Среднее значение

0.34

Cookie

Vitamin_C

Медиана

0

Cookie

Vitamin_C

Станд. отклон.

1.24

Cookie

Vitamin_C

Q1 - Q3

0 - 0.1

Cookie

Vitamin_C

IQR

0.1

Cookie

Vitamin_C

мин. - макс.

0 - 9.1

Cookie

Vitamin_C

CI

0.1 - 0.58

Cookie

Vitamin_E

Количество значений

100

Cookie

Vitamin_E

Количество пропущенных значений

0

Cookie

Vitamin_E

Среднее значение

1.31

Cookie

Vitamin_E

Медиана

1.08

Cookie

Vitamin_E

Станд. отклон.

1.02

Cookie

Vitamin_E

Q1 - Q3

0.26 - 2.12

Cookie

Vitamin_E

IQR

1.86

Cookie

Vitamin_E

мин. - макс.

0 - 4.32

Cookie

Vitamin_E

CI

1.11 - 1.51

Cookie

Vitamin_K

Количество значений

100

Cookie

Vitamin_K

Количество пропущенных значений

0

Cookie

Vitamin_K

Среднее значение

8.41

Cookie

Vitamin_K

Медиана

5.85

Cookie

Vitamin_K

Станд. отклон.

8.73

Cookie

Vitamin_K

Q1 - Q3

3.8 - 8

Cookie

Vitamin_K

IQR

4.2

Cookie

Vitamin_K

мин. - макс.

0 - 34.8

Cookie

Vitamin_K

CI

6.7 - 10.13

Rice

Alpha_Carotene

Количество значений

143

Rice

Alpha_Carotene

Количество пропущенных значений

0

Rice

Alpha_Carotene

Среднее значение

125.06

Rice

Alpha_Carotene

Медиана

4

Rice

Alpha_Carotene

Станд. отклон.

211.16

Rice

Alpha_Carotene

Q1 - Q3

0 - 193

Rice

Alpha_Carotene

IQR

193

Rice

Alpha_Carotene

мин. - макс.

0 - 926

Rice

Alpha_Carotene

CI

90.45 - 159.67

Rice

Beta_Carotene

Количество значений

143

Rice

Beta_Carotene

Количество пропущенных значений

0

Rice

Beta_Carotene

Среднее значение

310.92

Rice

Beta_Carotene

Медиана

74

Rice

Beta_Carotene

Станд. отклон.

469.49

Rice

Beta_Carotene

Q1 - Q3

6 - 415

Rice

Beta_Carotene

IQR

409

Rice

Beta_Carotene

мин. - макс.

0 - 2044

Rice

Beta_Carotene

CI

233.97 - 387.87

Rice

Beta_Cryptoxanthin

Количество значений

143

Rice

Beta_Cryptoxanthin

Количество пропущенных значений

0

Rice

Beta_Cryptoxanthin

Среднее значение

1.25

Rice

Beta_Cryptoxanthin

Медиана

0

Rice

Beta_Cryptoxanthin

Станд. отклон.

5.79

Rice

Beta_Cryptoxanthin

Q1 - Q3

0 - 0

Rice

Beta_Cryptoxanthin

IQR

0

Rice

Beta_Cryptoxanthin

мин. - макс.

0 - 31

Rice

Beta_Cryptoxanthin

CI

0.3 - 2.2

Rice

Carbohydrate

Количество значений

143

Rice

Carbohydrate

Количество пропущенных значений

0

Rice

Carbohydrate

Среднее значение

21.95

Rice

Carbohydrate

Медиана

21.36

Rice

Carbohydrate

Станд. отклон.

3.21

Rice

Carbohydrate

Q1 - Q3

19.82 - 23.22

Rice

Carbohydrate

IQR

3.4

Rice

Carbohydrate

мин. - макс.

15.03 - 32.5

Rice

Carbohydrate

CI

21.42 - 22.47

Rice

Cholesterol

Количество значений

143

Rice

Cholesterol

Количество пропущенных значений

0

Rice

Cholesterol

Среднее значение

2.51

Rice

Cholesterol

Медиана

0

Rice

Cholesterol

Станд. отклон.

6.65

Rice

Cholesterol

Q1 - Q3

0 - 1

Rice

Cholesterol

IQR

1

Rice

Cholesterol

мин. - макс.

0 - 47

Rice

Cholesterol

CI

1.42 - 3.6

Rice

Choline

Количество значений

143

Rice

Choline

Количество пропущенных значений

0

Rice

Choline

Среднее значение

7.63

Rice

Choline

Медиана

7.6

Rice

Choline

Станд. отклон.

4.22

Rice

Choline

Q1 - Q3

3.8 - 9.9

Rice

Choline

IQR

6.1

Rice

Choline

мин. - макс.

1.1 - 25

Rice

Choline

CI

6.93 - 8.32

Rice

Fiber

Количество значений

143

Rice

Fiber

Количество пропущенных значений

0

Rice

Fiber

Среднее значение

1.24

Rice

Fiber

Медиана

1.1

Rice

Fiber

Станд. отклон.

0.7

Rice

Fiber

Q1 - Q3

0.9 - 1.7

Rice

Fiber

IQR

0.8

Rice

Fiber

мин. - макс.

0.1 - 4.3

Rice

Fiber

CI

1.13 - 1.35

Rice

Lutein_and_Zeaxanthin

Количество значений

143

Rice

Lutein_and_Zeaxanthin

Количество пропущенных значений

0

Rice

Lutein_and_Zeaxanthin

Среднее значение

115.45

Rice

Lutein_and_Zeaxanthin

Медиана

88

Rice

Lutein_and_Zeaxanthin

Станд. отклон.

134.62

Rice

Lutein_and_Zeaxanthin

Q1 - Q3

0 - 165

Rice

Lutein_and_Zeaxanthin

IQR

165

Rice

Lutein_and_Zeaxanthin

мин. - макс.

0 - 600

Rice

Lutein_and_Zeaxanthin

CI

93.38 - 137.51

Rice

Lycopene

Количество значений

143

Rice

Lycopene

Количество пропущенных значений

0

Rice

Lycopene

Среднее значение

79.46

Rice

Lycopene

Медиана

0

Rice

Lycopene

Станд. отклон.

193.81

Rice

Lycopene

Q1 - Q3

0 - 0

Rice

Lycopene

IQR

0

Rice

Lycopene

мин. - макс.

0 - 849

Rice

Lycopene

CI

47.7 - 111.23

Rice

Niacin

Количество значений

143

Rice

Niacin

Количество пропущенных значений

0

Rice

Niacin

Среднее значение

1.56

Rice

Niacin

Медиана

1.43

Rice

Niacin

Станд. отклон.

0.49

Rice

Niacin

Q1 - Q3

1.21 - 2.04

Rice

Niacin

IQR

0.83

Rice

Niacin

мин. - макс.

0.29 - 2.55

Rice

Niacin

CI

1.48 - 1.64

Rice

Protein

Количество значений

143

Rice

Protein

Количество пропущенных значений

0

Rice

Protein

Среднее значение

2.89

Rice

Protein

Медиана

2.47

Rice

Protein

Станд. отклон.

1.2

Rice

Protein

Q1 - Q3

2.2 - 2.8

Rice

Protein

IQR

0.59

Rice

Protein

мин. - макс.

1.16 - 7.86

Rice

Protein

CI

2.7 - 3.09

Rice

Retinol

Количество значений

143

Rice

Retinol

Количество пропущенных значений

0

Rice

Retinol

Среднее значение

4.69

Rice

Retinol

Медиана

0

Rice

Retinol

Станд. отклон.

10.62

Rice

Retinol

Q1 - Q3

0 - 0

Rice

Retinol

IQR

0

Rice

Retinol

мин. - макс.

0 - 71

Rice

Retinol

CI

2.95 - 6.43

Rice

Riboflavin

Количество значений

143

Rice

Riboflavin

Количество пропущенных значений

0

Rice

Riboflavin

Среднее значение

0.05

Rice

Riboflavin

Медиана

0.05

Rice

Riboflavin

Станд. отклон.

0.03

Rice

Riboflavin

Q1 - Q3

0.03 - 0.07

Rice

Riboflavin

IQR

0.04

Rice

Riboflavin

мин. - макс.

0.01 - 0.16

Rice

Riboflavin

CI

0.05 - 0.06

Rice

Selenium

Количество значений

143

Rice

Selenium

Количество пропущенных значений

0

Rice

Selenium

Среднее значение

5.28

Rice

Selenium

Медиана

5.1

Rice

Selenium

Станд. отклон.

1.74

Rice

Selenium

Q1 - Q3

4.45 - 5.7

Rice

Selenium

IQR

1.25

Rice

Selenium

мин. - макс.

0.8 - 14.5

Rice

Selenium

CI

5 - 5.57

Rice

Sugar_Total

Количество значений

143

Rice

Sugar_Total

Количество пропущенных значений

0

Rice

Sugar_Total

Среднее значение

0.87

Rice

Sugar_Total

Медиана

0.74

Rice

Sugar_Total

Станд. отклон.

1

Rice

Sugar_Total

Q1 - Q3

0.38 - 0.98

Rice

Sugar_Total

IQR

0.6

Rice

Sugar_Total

мин. - макс.

0.05 - 8.76

Rice

Sugar_Total

CI

0.7 - 1.03

Rice

Thiamin

Количество значений

143

Rice

Thiamin

Количество пропущенных значений

0

Rice

Thiamin

Среднее значение

0.15

Rice

Thiamin

Медиана

0.14

Rice

Thiamin

Станд. отклон.

0.05

Rice

Thiamin

Q1 - Q3

0.12 - 0.17

Rice

Thiamin

IQR

0.05

Rice

Thiamin

мин. - макс.

0.01 - 0.3

Rice

Thiamin

CI

0.14 - 0.16

Rice

Water

Количество значений

143

Rice

Water

Количество пропущенных значений

0

Rice

Water

Среднее значение

71.72

Rice

Water

Медиана

72.59

Rice

Water

Станд. отклон.

4.62

Rice

Water

Q1 - Q3

69.8 - 74.48

Rice

Water

IQR

4.68

Rice

Water

мин. - макс.

51.52 - 83.14

Rice

Water

CI

70.97 - 72.48

Rice

Monosaturated_Fat

Количество значений

143

Rice

Monosaturated_Fat

Количество пропущенных значений

0

Rice

Monosaturated_Fat

Среднее значение

0.84

Rice

Monosaturated_Fat

Медиана

0.96

Rice

Monosaturated_Fat

Станд. отклон.

0.56

Rice

Monosaturated_Fat

Q1 - Q3

0.32 - 1.06

Rice

Monosaturated_Fat

IQR

0.74

Rice

Monosaturated_Fat

мин. - макс.

0.03 - 2.61

Rice

Monosaturated_Fat

CI

0.75 - 0.93

Rice

Polysaturated_Fat

Количество значений

143

Rice

Polysaturated_Fat

Количество пропущенных значений

0

Rice

Polysaturated_Fat

Среднее значение

0.73

Rice

Polysaturated_Fat

Медиана

0.91

Rice

Polysaturated_Fat

Станд. отклон.

0.46

Rice

Polysaturated_Fat

Q1 - Q3

0.3 - 1.05

Rice

Polysaturated_Fat

IQR

0.75

Rice

Polysaturated_Fat

мин. - макс.

0.03 - 2.56

Rice

Polysaturated_Fat

CI

0.66 - 0.81

Rice

Saturated_Fat

Количество значений

143

Rice

Saturated_Fat

Количество пропущенных значений

0

Rice

Saturated_Fat

Среднее значение

0.68

Rice

Saturated_Fat

Медиана

0.41

Rice

Saturated_Fat

Станд. отклон.

1.38

Rice

Saturated_Fat

Q1 - Q3

0.23 - 0.5

Rice

Saturated_Fat

IQR

0.27

Rice

Saturated_Fat

мин. - макс.

0.03 - 15.17

Rice

Saturated_Fat

CI

0.45 - 0.91

Rice

Total_Lipid

Количество значений

143

Rice

Total_Lipid

Количество пропущенных значений

0

Rice

Total_Lipid

Среднее значение

2.4

Rice

Total_Lipid

Медиана

2.42

Rice

Total_Lipid

Станд. отклон.

1.98

Rice

Total_Lipid

Q1 - Q3

0.89 - 2.71

Rice

Total_Lipid

IQR

1.82

Rice

Total_Lipid

мин. - макс.

0.09 - 17.23

Rice

Total_Lipid

CI

2.08 - 2.72

Rice

Minerals_Calcium

Количество значений

143

Rice

Minerals_Calcium

Количество пропущенных значений

0

Rice

Minerals_Calcium

Среднее значение

19.69

Rice

Minerals_Calcium

Медиана

11

Rice

Minerals_Calcium

Станд. отклон.

27.38

Rice

Minerals_Calcium

Q1 - Q3

8 - 16.5

Rice

Minerals_Calcium

IQR

8.5

Rice

Minerals_Calcium

мин. - макс.

2 - 133

Rice

Minerals_Calcium

CI

15.2 - 24.18

Rice

Minerals_Copper

Количество значений

143

Rice

Minerals_Copper

Количество пропущенных значений

0

Rice

Minerals_Copper

Среднее значение

0.08

Rice

Minerals_Copper

Медиана

0.08

Rice

Minerals_Copper

Станд. отклон.

0.03

Rice

Minerals_Copper

Q1 - Q3

0.06 - 0.09

Rice

Minerals_Copper

IQR

0.03

Rice

Minerals_Copper

мин. - макс.

0.03 - 0.25

Rice

Minerals_Copper

CI

0.07 - 0.08

Rice

Minerals_Iron

Количество значений

143

Rice

Minerals_Iron

Количество пропущенных значений

0

Rice

Minerals_Iron

Среднее значение

0.92

Rice

Minerals_Iron

Медиана

0.81

Rice

Minerals_Iron

Станд. отклон.

0.77

Rice

Minerals_Iron

Q1 - Q3

0.55 - 1

Rice

Minerals_Iron

IQR

0.45

Rice

Minerals_Iron

мин. - макс.

0.14 - 5.01

Rice

Minerals_Iron

CI

0.79 - 1.04

Rice

Minerals_Magnesium

Количество значений

143

Rice

Minerals_Magnesium

Количество пропущенных значений

0

Rice

Minerals_Magnesium

Среднее значение

21.45

Rice

Minerals_Magnesium

Медиана

16

Rice

Minerals_Magnesium

Станд. отклон.

10.55

Rice

Minerals_Magnesium

Q1 - Q3

12 - 32

Rice

Minerals_Magnesium

IQR

20

Rice

Minerals_Magnesium

мин. - макс.

5 - 39

Rice

Minerals_Magnesium

CI

19.73 - 23.18

Rice

Minerals_Phosphorus

Количество значений

143

Rice

Minerals_Phosphorus

Количество пропущенных значений

0

Rice

Minerals_Phosphorus

Среднее значение

68.73

Rice

Minerals_Phosphorus

Медиана

74

Rice

Minerals_Phosphorus

Станд. отклон.

29.22

Rice

Minerals_Phosphorus

Q1 - Q3

41 - 91.5

Rice

Minerals_Phosphorus

IQR

50.5

Rice

Minerals_Phosphorus

мин. - макс.

8 - 139

Rice

Minerals_Phosphorus

CI

63.94 - 73.52

Rice

Minerals_Potassium

Количество значений

143

Rice

Minerals_Potassium

Количество пропущенных значений

0

Rice

Minerals_Potassium

Среднее значение

87.96

Rice

Minerals_Potassium

Медиана

87

Rice

Minerals_Potassium

Станд. отклон.

37.09

Rice

Minerals_Potassium

Q1 - Q3

69 - 105.5

Rice

Minerals_Potassium

IQR

36.5

Rice

Minerals_Potassium

мин. - макс.

10 - 219

Rice

Minerals_Potassium

CI

81.88 - 94.04

Rice

Minerals_Sodium

Количество значений

143

Rice

Minerals_Sodium

Количество пропущенных значений

0

Rice

Minerals_Sodium

Среднее значение

238.12

Rice

Minerals_Sodium

Медиана

201

Rice

Minerals_Sodium

Станд. отклон.

91.79

Rice

Minerals_Sodium

Q1 - Q3

178 - 265

Rice

Minerals_Sodium

IQR

87

Rice

Minerals_Sodium

мин. - макс.

69 - 510

Rice

Minerals_Sodium

CI

223.07 - 253.16

Rice

Minerals_Zinc

Количество значений

143

Rice

Minerals_Zinc

Количество пропущенных значений

0

Rice

Minerals_Zinc

Среднее значение

0.57

Rice

Minerals_Zinc

Медиана

0.52

Rice

Minerals_Zinc

Станд. отклон.

0.2

Rice

Minerals_Zinc

Q1 - Q3

0.43 - 0.69

Rice

Minerals_Zinc

IQR

0.26

Rice

Minerals_Zinc

мин. - макс.

0.22 - 1.37

Rice

Minerals_Zinc

CI

0.54 - 0.6

Rice

Vitamin_A_RAE

Количество значений

143

Rice

Vitamin_A_RAE

Количество пропущенных значений

0

Rice

Vitamin_A_RAE

Среднее значение

35.92

Rice

Vitamin_A_RAE

Медиана

20

Rice

Vitamin_A_RAE

Станд. отклон.

46.89

Rice

Vitamin_A_RAE

Q1 - Q3

2.5 - 57.5

Rice

Vitamin_A_RAE

IQR

55

Rice

Vitamin_A_RAE

мин. - макс.

0 - 209

Rice

Vitamin_A_RAE

CI

28.23 - 43.6

Rice

Vitamin_B12

Количество значений

143

Rice

Vitamin_B12

Количество пропущенных значений

0

Rice

Vitamin_B12

Среднее значение

0.02

Rice

Vitamin_B12

Медиана

0

Rice

Vitamin_B12

Станд. отклон.

0.07

Rice

Vitamin_B12

Q1 - Q3

0 - 0

Rice

Vitamin_B12

IQR

0

Rice

Vitamin_B12

мин. - макс.

0 - 0.52

Rice

Vitamin_B12

CI

0.01 - 0.03

Rice

Vitamin_B6

Количество значений

143

Rice

Vitamin_B6

Количество пропущенных значений

0

Rice

Vitamin_B6

Среднее значение

0.1

Rice

Vitamin_B6

Медиана

0.1

Rice

Vitamin_B6

Станд. отклон.

0.03

Rice

Vitamin_B6

Q1 - Q3

0.09 - 0.12

Rice

Vitamin_B6

IQR

0.03

Rice

Vitamin_B6

мин. - макс.

0.03 - 0.18

Rice

Vitamin_B6

CI

0.09 - 0.1

Rice

Vitamin_C

Количество значений

143

Rice

Vitamin_C

Количество пропущенных значений

0

Rice

Vitamin_C

Среднее значение

2.9

Rice

Vitamin_C

Медиана

0.8

Rice

Vitamin_C

Станд. отклон.

4.37

Rice

Vitamin_C

Q1 - Q3

0 - 3.6

Rice

Vitamin_C

IQR

3.6

Rice

Vitamin_C

мин. - макс.

0 - 19.5

Rice

Vitamin_C

CI

2.19 - 3.62

Rice

Vitamin_E

Количество значений

143

Rice

Vitamin_E

Количество пропущенных значений

0

Rice

Vitamin_E

Среднее значение

0.31

Rice

Vitamin_E

Медиана

0.3

Rice

Vitamin_E

Станд. отклон.

0.16

Rice

Vitamin_E

Q1 - Q3

0.18 - 0.44

Rice

Vitamin_E

IQR

0.26

Rice

Vitamin_E

мин. - макс.

0.02 - 0.75

Rice

Vitamin_E

CI

0.29 - 0.34

Rice

Vitamin_K

Количество значений

143

Rice

Vitamin_K

Количество пропущенных значений

0

Rice

Vitamin_K

Среднее значение

5.45

Rice

Vitamin_K

Медиана

3.7

Rice

Vitamin_K

Станд. отклон.

5.79

Rice

Vitamin_K

Q1 - Q3

2.3 - 6.7

Rice

Vitamin_K

IQR

4.4

Rice

Vitamin_K

мин. - макс.

0 - 28.1

Rice

Vitamin_K

CI

4.5 - 6.4

Категориальные переменные

  1. Рассчитайте для всех категориальных переменных для каждой группы (Category):

1.1) Абсолютное количество;

1.2) Относительное количество внутри группы;

1.3) 95% ДИ для доли внутри группы - задание со звёздочкой.

# нет категориальных переменных подходящих для анализа

Визуализация

Количественные переменные

  1. Для каждой количественной переменной сделайте боксплоты по группам. Расположите их либо на отдельных рисунках, либо на одном, но читаемо;

  2. Наложите на боксплоты beeplots - задание со звёздочкой.

  3. Раскрасьте боксплоты с помощью библиотеки RColorBrewer.

theme_custom <- theme(
    panel.background = element_rect(fill = "white"),
    plot.title = element_text(size = 18, hjust = 0.5),
    plot.subtitle = element_text(size = 16, hjust = 0.5),
    strip.text = element_text(size = 16),
    axis.text = element_text(size = 16),
    axis.title = element_text(size = 18),
    legend.title = element_text(size = 16),
    legend.text = element_text(size = 16 ),
    legend.position = "right"
  )
# c использованием базового R (первый вариант)
#lapply(seq_along(cleaned_data)[sapply (cleaned_data, is.numeric)], function(i) {
#  y<-cleaned_data[[i]]
#  ggplot(cleaned_data, aes (x = Category, y = y, fill = Category))+
#  geom_boxplot(outliers = F) +
#  geom_beeswarm(size = 1.5, cex = 1, alpha = 0.3) +
#  theme_custom +
#  scale_fill_brewer(palette = "Accent") +
#  labs(y = "Value", title = paste0("Boxplot: ", colnames(cleaned_data)[[i]]))
#})
make_qqplot <- function(data, var) {
  data %>% 
    ggplot() +                                                    
    aes(x = Category, y = !!as.name(var), fill = Category) + 
    geom_boxplot(width = 0.2, notch = FALSE, position = position_dodge(1), lwd = 1, outlier.shape = NA)+
    scale_fill_brewer(palette = "Accent") +
    geom_beeswarm(size = 1.5, cex = 1, alpha = 0.3) +
    theme_custom 
}
vars <- cleaned_data %>% select(where(is.numeric)) %>% names ()

plots <- map(vars, ~ make_qqplot(cleaned_data, .x))
plots
## [[1]]

## 
## [[2]]

## 
## [[3]]

## 
## [[4]]

## 
## [[5]]

## 
## [[6]]

## 
## [[7]]

## 
## [[8]]

## 
## [[9]]

## 
## [[10]]

## 
## [[11]]

## 
## [[12]]

## 
## [[13]]

## 
## [[14]]

## 
## [[15]]

## 
## [[16]]

## 
## [[17]]

## 
## [[18]]

## 
## [[19]]

## 
## [[20]]

## 
## [[21]]

## 
## [[22]]

## 
## [[23]]

## 
## [[24]]

## 
## [[25]]

## 
## [[26]]

## 
## [[27]]

## 
## [[28]]

## 
## [[29]]

## 
## [[30]]

## 
## [[31]]

## 
## [[32]]

## 
## [[33]]

## 
## [[34]]

## 
## [[35]]

Категориальные переменные

  1. Сделайте подходящие визуализации категориальных переменных. Обоснуйте, почему выбрали именно этот тип.
 # нет подходящих категориальных переменных

Статистические оценки

Проверка на нормальность

  1. Оцените каждую переменную на соответствие нормальному распределению с помощью теста Шапиро-Уилка. Какие из переменных являются нормальными и как как вы это поняли?

Для теста Шапиро-Уилка:
Н0- выборка получена из нормального распределения (данные согласуются с нормальным распределением)
Н1- выборка получена из распределения, отличного от нормального
Т.к. значения p- value гораздо меньше порогового знаения (0.05), можем отвергнуть Н0 и сделать вывод, что все количественные данные в датасете не согласуются с нормальным распределением.

normality<-cleaned_data %>% 
       select(where (is.numeric))%>% 
       summarise_all( list(statistic = ~shapiro.test(.x)$statistic , 
                                  p.value = ~shapiro.test(.x)$p.value)) %>%
      pivot_longer (everything()) %>%
      separate (name, into = c ("Переменная", "Статистика"), sep= "_(?!.*_)") %>%
      filter (`Статистика` == "p.value") %>% select (!`Статистика`) %>% 
      rename (`p-value` = value) %>%
      mutate (`Нормальность (тест Шапиро-Уилка)` = ifelse (`p-value` > 0.05, "Да", "Нет" )) %>% 
      flextable() %>% 
      set_formatter(`p-value` = function(x) {
      formatC(x, format = "e", digits = 2)
      })

normality

Переменная

p-value

Нормальность (тест Шапиро-Уилка)

Alpha_Carotene

9.68e-26

Нет

Beta_Carotene

1.72e-24

Нет

Beta_Cryptoxanthin

4.18e-31

Нет

Carbohydrate

8.23e-18

Нет

Cholesterol

1.48e-29

Нет

Choline

4.02e-21

Нет

Fiber

5.20e-23

Нет

Lutein_and_Zeaxanthin

1.25e-20

Нет

Lycopene

1.06e-28

Нет

Niacin

4.67e-23

Нет

Protein

3.30e-15

Нет

Retinol

2.62e-29

Нет

Riboflavin

1.21e-27

Нет

Selenium

1.03e-18

Нет

Sugar_Total

7.34e-19

Нет

Thiamin

1.30e-20

Нет

Water

3.05e-19

Нет

Monosaturated_Fat

2.95e-17

Нет

Polysaturated_Fat

2.38e-18

Нет

Saturated_Fat

1.38e-20

Нет

Total_Lipid

4.49e-16

Нет

Minerals_Calcium

5.17e-21

Нет

Minerals_Copper

2.19e-18

Нет

Minerals_Iron

1.65e-19

Нет

Minerals_Magnesium

2.39e-13

Нет

Minerals_Phosphorus

6.01e-11

Нет

Minerals_Potassium

2.45e-15

Нет

Minerals_Sodium

6.83e-08

Нет

Minerals_Zinc

1.58e-10

Нет

Vitamin_A_RAE

1.19e-22

Нет

Vitamin_B12

2.36e-26

Нет

Vitamin_B6

8.86e-32

Нет

Vitamin_C

3.83e-24

Нет

Vitamin_E

2.49e-19

Нет

Vitamin_K

3.14e-19

Нет

  1. Постройте для каждой количественной переменной QQ-плот. Отличаются ли выводы от теста Шапиро-Уилка? Какой метод вы бы предпочли и почему?
lapply(seq_along(cleaned_data)[4:38], function(i) {
  dat<-cleaned_data[[i]]
  ggplot(cleaned_data, aes(sample = dat)) +
  geom_qq() +
  geom_qq_line() +
  #scale_color_manual(values = c("brown", "#E7B800"))+
  labs(y = "sample quantiles", x = "theoretical quantiles",  title = paste0("QQ-plot: ",colnames(cleaned_data)[[i]]))+
  theme_custom
})
## [[1]]

## 
## [[2]]

## 
## [[3]]

## 
## [[4]]

## 
## [[5]]

## 
## [[6]]

## 
## [[7]]

## 
## [[8]]

## 
## [[9]]

## 
## [[10]]

## 
## [[11]]

## 
## [[12]]

## 
## [[13]]

## 
## [[14]]

## 
## [[15]]

## 
## [[16]]

## 
## [[17]]

## 
## [[18]]

## 
## [[19]]

## 
## [[20]]

## 
## [[21]]

## 
## [[22]]

## 
## [[23]]

## 
## [[24]]

## 
## [[25]]

## 
## [[26]]

## 
## [[27]]

## 
## [[28]]

## 
## [[29]]

## 
## [[30]]

## 
## [[31]]

## 
## [[32]]

## 
## [[33]]

## 
## [[34]]

## 
## [[35]]

Результаты не отличаются от теста на нормальное распределение, если проводить сравнение без разделения на группы (категории). В данном случае выборки достаточно большие, поэтому больше подходит QQ- plot.
В целом графические методы более предпочтительны.

Результат тест Шапиро- Уилка очень зависит от объема выборки, и рекомендуется для относительно небольших выборок (до 50). Выборки разного размера из одной популяции могут давать совершенно разные резульаты теста. При больших выборках небольшие отклонения от нормального распределния могут привести к ложному отвержению нулевой гипотезы.

При разбиении на категории, графики некоторых величин, становятся более согласованными с нормальным распределением

  1. Ниже напишите, какие ещё методы проверки на нормальность вы знаете и какие у них есть ограничения.

Другие методы оценки нормальности

Есть еще аналитические тесты например Колмогорова-Смирного и Андерсона- Дарлинга, но считается что их мощность ниже чем теста Шапиро-Уилка.
Кроме того, используются такие характеристики как skewness (симметрия) and kurtosis (коэффициент эксцесса, мера остроконечности пика распределения величины). Недостатками этих моделей является то, что для них нет строгих критериев, какие значения параметра считать пороговыми для принятия решения о нормальности. Эти оценки также не заменяют построенеи QQ- plot (или гистограмм).

Сравнение групп

  1. Сравните группы (переменная Category) по каждой переменной (как количественной, так и категориальной). Для каждой переменной выберите нужный критерий и кратко обоснуйте его выбор в комментариях.
cleaned_data %>% group_by(Category)%>% tally()
cleaned_data %>%
  select(where(is.numeric)) %>% 
  names() %>% 
  set_names() %>% 
  map(function(x) t.test(cleaned_data[[x]] ~ cleaned_data$Category)$p.value < 0.05) %>% 
  enframe() %>% 
  unnest()
## Warning: `cols` is now required when using `unnest()`.
## ℹ Please use `cols = c(value)`.

Комментарий:

Для сравнения групп выбираем t-test для количественных переменных, так как объем выборки 100 измерений для категории “Cookie” и 143 для категории “Rice” позволяет нам использовать свойство нормализации средних значений, что позволяет не учитывать данные о нормальности рапределений в генеральной совокупности. В таком случае основной критерий - независимость значений переменных.

Н0 - средние значения переменной в группе 1 РАВНЫ среднему значению по данной переменной в группе 2
Н1 - средние значения переменной в группе 1 НЕ РАВНЫ среднему значению по данной переменной в группе 2

При значении p-value меньше порогового (0,05) Н0 отвергаем

В принципе непараметрический тест Манн-Уитни дает нам почти такие же результаты, за исключением результата для Сholosterol.
Так как t-test Cтьюдента обладает большей мощностью по сравнению с непараметрическим тестом Манна-Уитни (Wilcoxon test), в данном случае лучше выбрать его.

Далее идут необязательные дополнительные задания, которые могут принести вам дополнительные баллы в том числе в случае ошибок в предыдущих

Корреляционный анализ

  1. Создайте корреляционную матрицу с визуализацией и поправкой на множественные сравнения. Объясните, когда лучше использовать корреляционные матрицы и в чём минусы и плюсы корреляционных исследований.
require(psych)
require (corrplot)

correlation  <- psych::corr.test(cleaned_data[, c(4:38)],method = "spearman", adjust = "fdr") # c поправкой на множ. сравнения
corrplot(corr = correlation$r, # график для коэффициента корреляции
         method = "color",
         order = "hclust")

#correlation$p #значения p- value 

Корреляционный анализ используется для первичной “экслораторной” оценки данных с целью выявить возможные взаимосвязь между переменными и обозначить дальнейшие направления поиска. Позволяет оценить сразу много переменных.

Недостатком является то, что метод не позволяет анализировать качественные переменные (ковариация и как следствие кореляция могут быть осмысленно посчитаны только между количественными переменными.
Наличие корреляции не позволяет сделать вывод о наличии причинно-следственной связи, но помогает в дизайне исследований которые могут доказать причино-следственную связь. Также метод чувствителен к выбросам, и способен выявить лишь линейную взаимосвязь.

require (corrplot)

# вариант визуализации корреляционной матрицы с помощью corrplot, где крестиком отмечены незначимые различия по уровню p-value для части переменных
nums<-cleaned_data[,c(4:14)]
mat <- corr.test(nums,method = "spearman", adjust = "fdr")
res1 <- corrplot::cor.mtest(nums, conf.level = .95) ## specialized the insignificant value according to the significant level (0,05)
corrplot(mat$r, p.mat = res1$p) ## is significant level, with default value 0.05. 

Моделирование

  1. Постройте регрессионную модель для переменной Category. Опишите процесс построения
cleaned_data %>% group_by(Category) %>%summarise_if(is.numeric, mean, na.rm = TRUE)
colnames(cleaned_data)
##  [1] "Category"              "Description"           "Nutrient_Bank_Number" 
##  [4] "Alpha_Carotene"        "Beta_Carotene"         "Beta_Cryptoxanthin"   
##  [7] "Carbohydrate"          "Cholesterol"           "Choline"              
## [10] "Fiber"                 "Lutein_and_Zeaxanthin" "Lycopene"             
## [13] "Niacin"                "Protein"               "Retinol"              
## [16] "Riboflavin"            "Selenium"              "Sugar_Total"          
## [19] "Thiamin"               "Water"                 "Monosaturated_Fat"    
## [22] "Polysaturated_Fat"     "Saturated_Fat"         "Total_Lipid"          
## [25] "Minerals_Calcium"      "Minerals_Copper"       "Minerals_Iron"        
## [28] "Minerals_Magnesium"    "Minerals_Phosphorus"   "Minerals_Potassium"   
## [31] "Minerals_Sodium"       "Minerals_Zinc"         "Vitamin_A_RAE"        
## [34] "Vitamin_B12"           "Vitamin_B6"            "Vitamin_C"            
## [37] "Vitamin_E"             "Vitamin_K"
cleaned_data$Category <- as.factor(cleaned_data$Category) 
# для примера возьмем некоторые переменные. 
# Так как модель предсказывает категориальную переменную- то выбираем GLM
fit  <- glm(Category ~ `Beta_Carotene`  + `Lycopene`+ `Total_Lipid`+ `Choline`, cleaned_data, family = "binomial")
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
# выводим результат модели
summary(fit)
## 
## Call:
## glm(formula = Category ~ Beta_Carotene + Lycopene + Total_Lipid + 
##     Choline, family = "binomial", data = cleaned_data)
## 
## Coefficients:
##                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)    5.006241   0.869402   5.758 8.50e-09 ***
## Beta_Carotene  0.003598   0.001740   2.068   0.0387 *  
## Lycopene       1.650499   2.092589   0.789   0.4303    
## Total_Lipid   -0.586449   0.104758  -5.598 2.17e-08 ***
## Choline       -0.123520   0.053859  -2.293   0.0218 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 329.220  on 242  degrees of freedom
## Residual deviance:  65.937  on 238  degrees of freedom
## AIC: 75.937
## 
## Number of Fisher Scoring iterations: 16

Интерпретация (попытка):

Estimates это логарифм odds (то есть логарифм отношения вероятности одной категории “Сookie” к вероятности другой категории “Rice”). Таким образом мы трансформируем значения вероятности от + бесконечности до - бесконечности. Intercept отражает вероятность принадлежности к категории 2 (в данном случае “Rice”) при условии что все объясняющие переменные (terms) неизменны и равны 0. Estimate для каждой из переменных отражает изменение значения логарифма odds обусловленное данной переменной при условии, что остальные переменные неизменны.

В этой модели с увеличением содержания Total_Lipid, вероятность принадлежности к группе “Riсe” существенно уменьшается (значимо,p-value < 0.001 ) у, так как значение Estimate отрицательно. Также значимыми предикторами являются Бета-каротин и Холин (уровень значимость - 0.01).

exp(fit$coefficients) # можно перейти к коэффициентам (odds) от логарифма
##   (Intercept) Beta_Carotene      Lycopene   Total_Lipid       Choline 
##   149.3423036     1.0036042     5.2095789     0.5562990     0.8838041